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[目的 ] 本 研究 的 目标 是 开发 一 种 便携 式 气相 色谱 仪 , 结合 机 器 学 习 实现 现场 的 VOC 采集 和 
快速 的 气味 评价 。 

[方法 ] 我 们 使 用 卷 积 神经 网 络 -长 短期 记忆 (CNN-LSTM) 建立 了 气味 强度 的 预测 模型 。 由 
于 收集 的 数据 量 较 小 ， 我 们 使 用 生成 对 抗 网 络 (GAN ) 对 每 个 气味 强度 类 别 的 VOC 数据 进 
了 了 生成 ， 以 增强 模型 的 训练 。 

[结果 ] 在 生成 数据 后 ,我 们 再 次 使 用 CNN-LSTM 建立 了 模型 ， 并 与 人 工 神经 网 络 CANN) ~ 
支持 向 量 机 SVM) 和 梯度 提升 决策 树 (XG-Boost) 进行 了 比较 。 结 果 表 明 ， 使 用 GAN Æ 
成 数据 后 的 测试 准确 率 优 于 原始 数据 。 

[局 限 ] 未 来 的 工作 将 集中 在 进一步 优化 模型 和 扩大 数据 集 上 ， 以 提高 预测 的 准确 性 和 稳定 
性 。 
[结论 ] 这 项 研究 表明 ， 通 过 使 用 深度 学 习 和 生成 对 抗 网 络 ， 我 们 可 以 有 效 地 预测 车 内 的 气 
味 强度 ， 从 而 改善 车 内 的 空气 质量 。 此 外 ,我 们 还 将 探索 将 这 种 方法 应 用 于 其 他 环境 条 件 下 
的 空气 质量 预测 。 这 为 未 来 的 空气 质量 监测 和 改善 提供 了 新 的 可 能 性 。 由 于 我 们 的 设备 是 便 
携 式 的 ， 且 模型 结构 较 小 可 以 直接 嵌入 到 设备 上 ， 从 而 实现 现场 的 VOC 采集 和 快速 的 气味 
评价 。 这 为 未 来 的 空气 质量 监测 和 改善 提供 了 新 的 可 能 性 。 
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Abstract: 

[Objective] The aim of this study is to develop a portable gas chromatograph, combined with 
machine learning, to achieve on-site VOC collection and rapid odor evaluation. 

[Methods| We used a Convolutional Neural Network-Long Short-Term Memory (CNN-LSTM) 
to establish an odor intensity prediction model. Due to the small amount of data collected, we used 
a Generative Adversarial Network (GAN) to generate VOC data for each odor intensity category 
to enhance model training. 

[Results] After generating the data, we used CNN-LSTM to establish the model again and 
compared it with Artificial Neural Networks (ANN), Support Vector Machines (SVM), and 
Gradient Boosting Decision Trees (XG-Boost). The results showed that the test accuracy after 
using GAN to generate data was better than the original data. 

[Limitations] Future work will focus on further optimizing the model and expanding the dataset 
to improve the accuracy and stability of the prediction. 

[Conclusion] This study shows that by using deep learning and generative adversarial networks, 
we can effectively predict the odor intensity inside the car, thereby improving the air quality inside 
the car. In addition, we will explore the application of this method to air quality prediction under 
other environmental conditions. This provides new possibilities for future air quality monitoring 
and improvement. As our equipment is portable and the model structure is small enough to be 
directly embedded into the device, it can achieve on-site VOC collection and rapid odor 
evaluation. This provides new possibilities for future air quality monitoring and improvement. 
Keywords: Portable Gas Chromatography, On-site VOC Collection, Odor Intensity Prediction, 
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1. 背景 

车 内 的 挥发 性 有 机 物 (VOC) 是 影响 车 内 空气 质量 的 主要 原因 之 一 。 主 要 包括 
烷烃 、 烯 烃 、 芳 烃 和 醛 酮 类 物质 币 。 这 些 VOC 由 车 内 饰 件 释 放出 来 后 ， 会 对 人 
体 产生 不 同 程度 的 危害 。 在 日 晒 导 致 的 高 温 下 , 车 内 零 部 件 及 装饰 材料 中 的 VOC 
则 更 易 挥发 出 来 231。 根 据 J.D. Power 在 中 国 开展 的 "初始 质量 研究 " QS), " 


A "问题 一 直 是 新 车 车 主 的 一 个 突出 问题 。 在 2023 年 的 研究 报告 中 ， 该 
问题 被 列 为 内 燃 机 汽车 和 新 能 源 汽车 车 主 遇 到 的 20 大 问题 之 一 。 值得 注意 的 
是 ， 在 过 去 三 年 中 ， 这 一 问题 一 直 排 在 前 三 位 由 。 因 此， 为 了 满足 用 户 需 求 ， 提 
高 各 主机 厂 的 产品 竞争 力 ， 从 实际 出 发 ， 对 车 内 异味 、 零 部 件 异味 、 材 料 异 味 进 
行 评估 至 关 重 要 。 
目前 , 汽车 主机 厂 普遍 采用 主观 气味 评估 方法 来 进行 气味 的 质量 控制 , 该 方法 直 
接 反 映 了 用 户 对 气味 的 接受 程度 .61。 该 方法 是 由 专业 的 气味 评价 员 组 成 的 团队 
来 进行 主观 气味 评级 。 然 而 ， 这 种 方法 存在 一 些 限制 。 首 先 ， 评估 结 果 容 易 受 到 
评估 人 员 个 人 身体 和 心理 状态 的 影响 。 此 外 , 不 同 个 体 之 间 的 评估 结果 存在 差异 ， 
如 性 别 差异 等 四。 其 次 ， 不 同 气 味 评估 组 之 间 的 评估 结果 可 能 不 一 致 ， 同 一 材料 
在 不 同 评估 机 构 的 评估 中 可 能 得 出 不 同 的 结果 外。 同时 ， 高 温 处理 的 材料 可 能 释 
放大 量 有 害 的 挥发 性 有 机 化 合 物 , 持续 的 气味 评估 工作 可 能 对 评估 人 员 的 长 期 健 
康 构成 风险 。 因 此 ， 建 立 客观 的 气味 评估 方法 具有 人 至 关 重 要 的 意义 。 

当前 , 开发 客观 的 气味 评估 体系 已 经 成 为 了 环境 研究 领域 的 一 个 焦点 名 。 现 阶段 ， 
主要 的 方法 是 基于 Weber-Fechner law 将 某 几 种 VOC 与 气味 的 感官 强度 级 别 联系 
起 来 。 具 体 来 说 ， 该 方法 是 在 一 个 已 知 的 体系 中 加 入 某 几 种 固定 的 VOC， 将 其 
测定 的 浓度 与 这 个 体系 的 气味 进行 关联 na。 

然而 ， 气 味 相互 作用 的 情况 却 普遍 存在 ， 且 会 受到 多 种 作用 的 影响 ， 多 种 VOCs 
之 间 会 产生 相互 作用 导致 其 混合 物 的 气味 强度 会 低 于 简单 的 各 种 VOC 单独 体系 
气味 强度 的 又 加 (U1, 这 对 于 车 内 复杂 的 VOC 体系 气味 的 客观 评估 则 造成 了 困难 。 
然而 使 用 机 器 学 习 (ML ) 则 可 以 自发 的 学 习 VOCs 与 气味 之 间 的 关系 ， 因 此 可 
以 用 于 气味 强度 建 模 研究 。 

为 了 实现 现场 快速 气味 客观 评价 , 将 VOCs 进行 快速 的 采集 和 浓度 计算 则 是 有 必 
要 的 。 便 携 式 的 气相 色谱 仪 (PGC ) 由 于 其 体积 小 ， 重 量 轻 ， 方 便携 带 。 这 使 得 
它 可 以 在 任何 地 方 进行 现场 检测 , 无需 将 样品 带 回 实 验 室 。 同 时 气相 色谱 可 以 在 
短 时 间 内 对 各 种 竺 检测 的 VOC 实现 分 离 并 且 使 用 检测 器 各 自 进行 定量 。 从 而 能 
够 实现 现场 快速 的 VOC 定量 分 析 09。 光 离子 化 检测 器 (PID) 的 工作 原理 是 使 用 

个 紫外 光源 (通常 是 10.6 eV 的 气 灯 ) 去 电离 检测 气体 样本 分 子 。 当 样本 分 子 吸收 
紫外 光 的 能 量 时 ,如 果 该 能 量 高 于 分 子 的 电离 能 ,样本 分 子 会 被 电离 形成 正 负 离 


uj 


子 。 这 些 电离 后 的 离子 会 导致 测量 电流 的 变化 ,从 而 检测 和 定量 样品 中 组 分 的 浓 
HEU, PID 具有 体积 小 、 灵 敏 度 高 、 响 应 快 等 优点 。 结 合 上 述 优势 ， 可 以 使 用 
GC-PID 来 实现 VOC 的 现场 快速 检测 。 

本 研究 的 目的 是 基于 深度 学 习 方 法 开发 一 种 ， 现 场 快 速 气味 评价 的 方法 。 
有 具体 来 说 ， 我 们 使 用 GC-PID 采集 了 现场 车 内 的 VOCs 数据 和 气味 强度 数据 116 
条 。LSTM 具有 记忆 功能 可 以 把 握 各 种 VOC 之 间 的 相互 联系 和 作用 3。 因此 ， 
我 们 使 用 采集 VOC 和 和 气味 的 数据 基于 CNN-LSTM 建立 了 气味 预测 模型 。 由 于 
各 个 气味 类 别 的 数据 分 布 并 不 均匀 ， 因 此 我 们 使 用 生成 对 抗 网 络 (GAN ) 对 每 
个 气味 强度 类 别 的 VOCs 数据 进行 了 生成 ， 以 增强 模型 的 训练 。 为 了 选择 最 佳 的 
ML 算法 来 建立 当前 的 气味 模型 ， 我 们 使 用 了 人 工 神经 网 络 CANN) 、 支 持 向 量 
NL (SVM) 和 梯度 提升 决策 树 〈XG-Boost) 与 CNN-LSTM 进行 比较 。 


2. 材料 和 方法 

2.1 VOCs 和 气味 数据 采集 
我 们 的 数据 集 包括 汽车 内 饰 件 和 整 车 一 共 116 条 数据 。 对 于 内 饰 件 来 说 , 我 们 在 
采集 VOCs 时 主要 参考 法 规 ISO 12219-905 中 规定 的 采样 袋 方法 。 首 先 将 内 饰 件 


同 表面 的 PE( 聚 乙烯 ) 软 包装 仪器 在 常温 平衡 仓 中 〈T:253%C，RH:50% ) 平衡 24 ho 


将 内 饰 件 放 入 2000 L Tedlar KIÉR (Ningbo Huance Equipment co., LTD.) 对 材料 
进行 测试 。 在 确保 采样 袋 充 分 老化 后 ， 将 样品 于 采样 袋 中 密封 ， 使 用 3096 No 清 


洗 采 样 袋 三 次 后 充 入 50% Nz， 使 用 高 温 测 试 仓 将 采样 袋 在 6542C FFE 2h, 


使 得 VOCs 释放 和 平衡。 随后， 温度 保持 在 65°C 时 进行 采样 。 
在 整 车 的 研究 中 ， 我 们 参照 了 中 国 环保 行业 标准 HI/T 400-200709 的 规定 ， 对 整 
车 进行 了 VOCs 采集 。 然 而 ， 由 于 我 们 进行 的 是 现场 快速 测试 ， 采 集 过 程 并 未 严 
格 按照 标准 中 规定 的 在 25%C 的 条 件 下 封闭 16 小 时 。 相 反 , 我 们 根据 实际 的 工 况 ， 
对 车 内 环境 进行 了 平衡 和 采集 。 这 种 方法 虽然 与 标准 有 所 不 同 , 但 更 贴近 实际 的 
使 用 环境 。 

我 们 使 用 便携 的 GC-PID 进行 VOCs 采集 和 定量 ， 采 集 流 速 为 40 mL/min, AE 
时 间 2 min。 色 谱 柱 : AB-INOWAX(30 m x0.32 mmx1 um), RAX N2, 程序 升 


made 1 所 示 : 


表 1 GC-PID 程序 升温 条 件 


A 


梯度 速率 C/min ”温度 保持 时 间 min 
1 40 2.2 

2 2.58 55 0 

3 4.17 60 0 

4 2 65 4 

3 38 160 0.3 

6 5 220 10 


气味 强度 的 评估 是 由 专业 的 气味 评价 团队 进行 的 ， 该 团队 由 5 到 6 名 经 过 专 
业 训 练 的 气味 评价 员 组 成 。 我 们 采用 了 一 个 六 级 的 气味 强度 评价 系统 ， 等 级 从 1 
(无 法 检测 ) 到 6 无 法 忍受 ) 。 原 则 上 ， 评 价 员 们 以 0.5 的 等 级 为 间隔 进行 评 
价 , 但 为 了 获得 更 精确 的 评价 结果 ,我 们 也 允许 评价 员 在 评价 时 给 出 3.0+ 或 3.0- 
的 结果 。 这 种 评价 方法 不 仅 有 利于 我 们 的 模型 进行 更 精确 的 分 级 , 而 且 可 以 有 效 
地 监督 气味 是 否 超 过 标准 , 同时 还 为 模型 提供 了 更 大 的 容错 空间 。 所 有 评价 员 给 
出 的 气味 强度 的 算术 平均 值 应 作为 最 终 的 气味 结果 01。 对 于 内 饰 件 来 说 ， 在 
VOCs 采样 完成 后 ， 将 2000 工 采样 袋 边缘 的 密封 条 打开 一 个 约 4-6 cm 的 小 口 ， 
由 6 名 气味 评价 员 依 次 评价 。 对 于 整 车 来 说 ， 在 VOCs 采集 完成 后 ，5 名 气味 评 
价 员 打 开车 门 并 在 10 s 之 内 上 和 车 进行 气味 评价 。 
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2.2 ANN 
人 工 神 经 网 络 CANN) 是 模拟 人 脑 行为 的 计算 模型 ， 用 于 学 习 输入 和 输出 之 间 
的 关系 。 我 们 使 用 反 向 传播 (BP) 算法 训练 ANN， 通 过 计算 输出 误差 并 反 向 传 
播 来 调整 参数 ， 使 输出 接近 期 望 值 。 在 本 研究 中 ， 我 们 使 用 BP 训练 ANN 进行 
气味 强度 分 级 。ANN 的 结构 如 图 1 所 示 : 
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1 ANN 气味 模型 结构 

如 图 所 示 ， 我 们 使 用 了 一 个 双 隐 藏 层 结构 的 ANN 网 络 ，VOCs 数据 经 过 隐 
含 层 计算 后 回归 到 C 个 维度 〈C 代表 气味 强度 类 别 ,C=10) 并 通过 Softmax 函数 
处 理 将 多 分 类 的 输出 值 转换 为 范围 在 [0, 1] 和 为 1 的 概率 分 布 ， 从 而 得 到 各 个 气 
味 强度 级 别 的 概率 。 所 使 用 的 损失 函数 为 CrossEntropyLoss, 我 们 使 用 了 AdamW 
作为 优化 器 并 加 入 权重 衰减 系数 (Weight_Decay) ， 它 通过 在 损失 函数 中 添加 正 
则 化 项 ， 惩 罚 模 型 的 权重 参数 ， 使 模型 更 倾向 于 选择 较 小 的 权 09, 通过 控制 
Weight Decay 值 的 大 小 ， 可 以 有 效 的 对 模型 的 过 拟 合 和 欠 拟 合 问 题 进行 权衡 ， 
优化 出 最 佳 的 模型 。 设 置 学 习 率 为 0.01，Weight Deca 设 为 0.1。 将 数据 集 划 分 
为 训练 集 , 验证 集 和 测试 集 三 部 分 。 由 于 各 种 VOC 之 间 的 绝对 值 差异 很 大 , VOCs 
数据 在 输入 网 络 前 进行 了 Z-Score 处 理 ， 它 会 将 每 种 VOCs 进行 标准 化 ， 使 得 数 
据 均值 为 0， 方差 为 1。 训练 时 采用 了 一 种 基于 验证 集 的 早 停 策略 。 有 具体 来 说 ， 
在 每 次 训练 迭代 过 程 中 都 会 检查 模型 在 验证 集 上 的 准确 率 ,一 旦 模型 在 验证 集 上 
的 准确 率 达 到 目标 就 会 停止 训练 并 保存 当前 的 模型 参数 并 用 于 测试 。 


2.3 XG-Boost 和 SVM 
XG-Boost 和 SVM 已 经 被 广泛 的 应 用 于 各 种 分 类 问题 中 必 20。 对 于 SVM 来 说 ， 
由 于 其 本 质 是 对 于 二 元 分 类 问题 选择 最 优 的 分 类 超 平面 , 因此 其 无 法 直接 处 理 多 
分 类 问题 。 通 常 SVM 会 以 "一 对 一 ”或 “一 对 多 ”策略 来 进行 多 分 类 2。 在 本 研究 
中 SVM 采取 “一 对 一 ”策略 来 进行 多 分 类 。 同 时 , 为 了 寻找 到 最 佳 的 超 参数 组 合 ， 


我 们 使 用 了 网 格 搜索 (GridSearch) 算法 来 对 模型 的 超 参 数 寻 优 。 


2.4 CNN-LSTM 

本 研究 构建 了 基于 CNN 进行 特征 增强 ，LSTM 进行 记忆 从 而 把 握 把 握 各 种 
VOC 之 间 相 互联 系 的 气味 分 类 模型 。 有 具体 来 说 数据 以 [1xm] 的 维度 输入 到 三 层 郑 
RER, HF n 是 指 VOC 的 种 类 数 。 对 每 一 层 使 用 16k 个 卷 积 核 进 行 步 长 为 1 
的 卷 积 (k 为 层 数 =1,2,3)。 这 样 ,经 过 三 层 卷 积 后 数据 的 维度 就 会 变 成 (1x64xn)。 
在 每 一 层 卷 积 运算 完成 后 ， 我 们 都 接 上 了 一 个 BatchNorm 层 ， 并 且 使 用 Relu tk 
活 函 数 对 数据 进行 非 线性 变换 。 随 后 数据 经 过 一 个 神经 元 个 数 为 64 的 全 连接 层 ， 
这 一 层 不 会 改变 数据 的 维度 却 有 助 于 提高 模型 的 表达 能 力 。 随 后 在 经 过 一 个 
Dropout 层 处 理 后 数据 以 (nx64) 的 形式 输入 到 BiLSTM ON LSTM) 层 中 , n 为 
seq len, 64 为 input_size， 这 代表 每 种 VOCs 以 64 维 的 向 量 进行 表示 。 这 表示 
在 每 个 时 间 步 (1-n) ，BiLSTM 会 读 取 每 个 序列 的 一 种 VOCs CREI 64 维 的 
向 量 ) ， 并 更 新 其 隐藏 状态 。 这 样 LSTM 则 会 在 前 后 两 个 方向 捕捉 VOCs 浓度 
之 间 的 相互 影响 。 随 后 经 过 一 个 全 连接 层 并 将 数据 维度 回归 到 (1x10) 经 过 
Softmax 层 转 化 为 各 个 浓度 级 别 的 概率 并 输出 。 算 法 的 优化 器 和 损失 函数 等 配置 
同 AdamW 优化 器 。 


2.5 GAN 
在 我 们 的 研究 中 ， 我 们 采用 了 CNN-LSTM 深度 学 习 模 型 。 尽 管 该 模型 是 轻 量 级 
的 ， 但 仍 需 要 大 量 训 练 样本 才能 充分 发 挥 其 性 能 。 为 解决 这 一 问题 ， 我 们 采取 了 
增加 训练 集 样本 量 的 策略 ， 并 尽 可 能 使 各 类 别 标签 分 布 均匀 。 然 而 ， 实 际 训练 样 
本 中 ,气味 强度 >3.7 的 零 部 件 或 整 车 样本 较 少 , 这 些 是 我 们 需要 重点 关注 的 对 象 。 
因此 ， 我 们 采用 了 生成 对 抗 网 络 (GAN) 基于 训练 集 数据 对 各 气味 类 别 的 VOC 
进行 数据 生成 。 


VOCs 数 据 
VOCs 数 据 


Generator 


2 GAN 网 络 的 原理 图 


在 数据 进行 预 处 理 之 后 ，GAN 首先 定义 了 判别 器 和 生成 器 模型 。 接 着 ， 通 过 对 
抗 训练 的 方式 ， 训 练 判别 器 和 生成 器 ， 使 其 生成 逼真 的 数据 样本 。 最 后 ， 使 用 生 
成 器 生成 新 的 数据 ， 并 与 原始 数据 拼接 在 一 起 。 这 种 数据 增强 方法 可 以 对 每 个 气 
味 强度 下 的 VOCs 数据 进行 生成 , 扩充 数据 集 的 规模 和 多 样 性 从 而 提升 模型 的 泛 
化 能 力 和 性 能 。 GAN 的 原理 如 图 2 所 示 , 使 用 GAN 进行 数据 生成 并 建立 模型 的 
流程 如 图 3 所 示 。 


io | —- 数据 集 划 分 
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图 3 使 用 GAN 进行 数据 生成 并 建立 模型 的 流程 图 


3. 结果 与 讨论 


3.1 数据 描述 

在 本 研究 中 ， 共 收集 了 118 条 零 部 件 和 整 车 VOCs 数据 以 及 对 应 的 气味 标签 ， 涵 盖 了 
10 个 气味 类 别 。 如 表 2 所 示 ， 各 个 类 别 的 气味 标签 分 布 并 不 均匀 ， 特 别 是 3.5 级 别 以 上 的 气 
味 样 本 数量 较 少 。 这 主要 是 因为 在 实际 测试 中 , 气味 强度 大 于 3.5 的 样本 很 少见 , 尤其 是 4.0 
级 别 以 上 的 气味 样本 几乎 不 存在 。 因 此 ， 为 了 解决 这 个 问题 ,采用 了 生成 对 抗 网 络 (GAN) 
进行 数据 增强 , 将 生成 的 数据 与 原始 数据 一 起 用 于 模型 训练 。 这 样 做 的 目的 是 为 了 解决 数据 
量 分 布 不 均匀 可 能 导致 的 过 拟 合 和 欠 拟 合 问题 ， 从 而 提高 模型 的 泛 化 能 力 。 在 使 用 GAN Æ 
成 数据 后 ， 各 个 气味 类 别 的 数据 分 布 在 表 2 中 进行 了 总 结 ， 生 成 后 的 数据 分 布 更 为 均匀 。 然 
而 ， 由 于 个 别 级 别 的 样本 量 较 少 ，GAN 的 学 习 对 象 有 限 ， 如 果 生 成 大 量 数据 ， 可 能 会 导致 
生成 的 数据 过 分 依赖 于 个 别 数据 ， 从 而 造成 严重 的 过 拟 合 。 


1L 


&2 各 个 类 别 气味 标签 的 分 布 情况 


气味 类 别 数据 (原始 ) ”数据 (增强 后 ) 


2.5 9 32 
2.5+ 3 18 
3.0- 19 34 
3.0 33 35 
3.0+ 29 29 
3.5- 4 32 
3.5 16 33 
3.54 3 21 
4.0- 1 11 
4.0 1 11 


我 们 使 用 PGC 收集 的 VOCs 共有 8 种 〈 其 中 包括 5 种 茶 系 物 和 3 种 醛 类 化 合 物 )， 并 且 
我 们 收集 了 TVOC (总 VOCs), Kp TVOC 是 甲 茶 进行 半 定 量 的 ， 因 此 模型 的 输入 维度 为 
[1x9]， 模 型 的 输出 则 为 气味 强度 类 别 。 


3.2 未 使 用 GAN 时 的 模型 

当 我 们 使 用 原始 的 118 条 数据 建 模 时 ， 我 们 使 用 了 93 条 数据 进行 建 模 ， 各 自 使 用 14 
条 数据 来 进行 验证 和 测试 。 由 于 4.0- 和 4.0 的 数据 只 有 一 条 ， 因 此 在 验证 和 测试 的 数据 中 则 
没有 包含 这 两 个 类 别 。 表 3 总 结 了 各 个 算法 的 准确 率 和 参数 。 除了 计算 模型 对 气味 强度 的 完 
全 匹配 准确 率 外 ， 我 们 还 计算 了 在 气味 强度 修 约 到 0.5 级 后 的 准确 率 ， 这 是 一 个 衡量 模型 鲁 
棒 性 的 重要 指标 。 在 实际 的 气味 评价 过 程 中 ， 气 味 强度 通常 会 被 修 约 至 0.5 级 ， 因 此 ， 这 种 
修 约 后 的 准确 率 能 够 更 好 地 反映 模型 在 实际 应 用 中 的 性 能 ,图 4 则 更 佳 准确 的 展示 出 各 种 人 
法 在 验证 和 测试 集 各 个 气味 类 别 上 的 预测 能 力 。 
表 3 原始 训练 集 各 模型 的 准确 率 和 参数 


Algorithm \ Accuracy Parameters 


Data set Train set Val set Val/0.5 Test set Test/0.5 


ANN 96.67% 50.00% 92.86% 35.72% 92.86% Lr:0.01, W_D:0.1, hidden nodes:(11,22), epoch:110 


SVM 51.61% 28.57% 92.86% 21.43% 92.86% Kernel:rbf, C:0.1, gamma: 1 


XG-Boost 72.04% 57.14% 92.86% 7.14% 78.57% Lr:0.01, max_depth:5, n_estimators:200 


Conv: 16-32-64, 1r:0.001, W_D:0.1, epoch:60 


CNN-BiLSTM 88.17% 57.14% 100% 42.86% 100% 
BiLSTM:150, Fc:(64,150), Dropout:0.2 


| 真实 值 
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4 未 使 用 GAN 时， 各 个 模型 的 验证 和 测试 结果 
从 表 4 可 以 看 出 , ANN 和 CNN-LSTM 在 训练 集 上 都 取得 了 较 好 的 结果 , 在 验证 集 和 测试 集 


上 CNN-LSTM 略 好 过 ANN, H CNN-LSTM 在 0.5 级 以 内 的 准确 率 为 100%， 这 表面 


CNN-LSTM 模型 已 经 能 在 0.5 级 内 准确 的 预测 气味 强度 。 


3.2 使 用 GAN 后 的 模型 
在 使 用 了 GAN 进行 训练 数据 增强 后 ， 训 练 数据 共 228 条 ， 为 了 能 够 横向 比较 数据 增强 前 后 


模型 的 结果 ， 验 证 和 测试 数据 保持 不 变 。 
表 4 训练 集 使 用 GAN 后 各 模型 的 准确 率 和 参数 


Algorithm \ Accuracy Parameters 


Data set Train set Val set Val/0.5 Test set Test/0.5 


ANN 94.30% 50% 50% 100% 100% Lr:0.01, W_D:0.1, hidden nodes:(11,22), epoch:110 


SVM 96.05 35.7196 35.71% 85.71% 85.71% Kernel:rbf, C:0.1, gamma: 1 

XG-Boost 100% 42.86% 100% 21.43% 78.57% Lr:0.01, max_depth:5, n_estimators:200 
Conv: 16-32-64, 1r:0.001, W_D:0.1, epoch:60 

CNN-BiLSTM 95.18% 78.57% 100% 57.14% 100% 


BiLSTM:150, 


Fe:(64,150), Dropout:0.2 


真实 值 
-« ANN 
*» SVM 
* XG-boost 
** CNN-LSTM 


图 5 GAN 增强 训练 集 后 各 模型 的 验证 和 测试 结 
由 表 4 可 知 ，GAN 对 训练 集 数 据 增强 后 ， 各 个 模型 从 验证 
CNN-LSTM 的 验证 准确 率 达 到 了 78.57%(11/14)。 测 试 集 准 确 率 


和 测试 准确 率 皆 有 提升 ， 
也 达到 了 57.14 (8/14) %。 


0.5 级 之 内 的 准确 率 均 为 100%， 此 时 模型 已 经 能 够 准确 的 对 气味 进行 预测 ， 其 泛 化 能 力 还 


需要 进一步 提升 。 值 得 注意 的 是 此 时 的 CNN-LSTM 模型 能 对 气味 强度 大 于 3.5 的 高 气味 强 


D 


度数 据 吉 奥 为 准确 的 判别 ， 这 对 于 气味 识别 监测 异常 件 的 作用 则 较为 重要 。 


为 了 验证 模型 学 习 到 了 真实 的 规律 ， 我 们 还 使 用 了 


Explanations ) 方法 来 对 CNN-LSTM 模型 进行 解释 ， 以 验证 模型 是 


SHAP (SHapley Additive 


否 学 习 到 了 真正 的 气味 规 


律 。 气 味 阀 值 是 指 人 类 能 够 察觉 到 某 种 物质 气味 的 最 低 浓度 。 因 此 ， 气 味 阔 值 越 低 ， 意 味 着 


这 种 物质 的 气味 在 较 低 的 浓度 下 就 能 被 人 类 察觉 到 。 换 句 话说 ,气味 闵 值 越 低 的 物质 ， 其 气 


味 通常 被 认为 更 强烈 。 我 们 可 以 看 出 ， 各 种 VOC 对 气味 的 贡献 并 不 是 完美 的 符合 嗅 闷 值 的 


规律 Pn, MABEL ASAE de 5 所 示 。 这 可 能 是 由 于 三 方面 的 原因 


设备 对 VOC 的 分 离 和 监测 能 力 有 限 ， 定 量 结果 可 能 存在 误差 ， 且 


导致 的 ， 首 先 由 于 便携 式 


收集 到 的 VOC 种 类 较 少 。 


其 次 单一 VOC 最 终 对 气味 产生 影响 的 气味 活 度 值 还 于 VOC 的 浓度 有 关 ， 不 只 依赖 咱 


最 后 收集 到 的 样本 量 依然 较 小 ， 不 足以 反应 真实 的 气味 规则 。 
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6 GAN 增强 训练 集 后 各 模型 的 验证 和 测试 结果 


High 


Feature value 


Low 


SHAP value (impact on model output) 
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4. 结论 与 展望 


本 研究 基于 CNN-LSTM 和 PGC 开发 了 一 种 现场 快速 气味 评价 方法 。 该 方法 能 够 有 效 
地 对 车 内 气味 强度 进行 预测 ，10 个 类 别 的 气味 识别 准确 率 能 达到 67.86%， 且 能 够 实现 半 级 
之 内 准确 率 为 100% 的 气味 强度 评价 。 与 其 他 三 种 机 器 学 习 算法 相 比 ，CNN-LSTM 模型 具有 
更 好 的 泛 化 能 力 和 和 鲁 棒 性 。 本 研究 为 现场 快速 气味 评价 提供 了 新 的 思路 和 方法 。 未 来 ， 可 以 
从 以 下 几 个 方面 进一步 改进 和 完善 该 方法 。 首先 可 以 进一步 扩大 数据 集 ， 以 提高 模型 的 泛 化 
能 力 。 可 以 将 该 方法 与 其 他 气味 评价 方法 相 结合 ， 以 提高 气味 评价 的 准确 性 和 可 靠 性 。 也 可 


以 将 该 方法 应 用 于 其 他 需要 且 识 别 的 领域 ， 如 食品 、 化 妆 品 和 纺织 品 等 行业 的 气味 评价 。 
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